工場のセンサーデータ
には、準周期タイプと流れタイプがありますが、このページは、準周期タイプの話です。
準周期ではない、周期データは、下のようなものです。
四季や、24時間のような規則的な周期を背景に持っているデータだと、これに近くなります。
時系列解析 のページで、一般的な時系列解析の解説では、 自己相関分析 や スペクトル解析 が解説されていると書きましたが、こうした理論では、周期性を前提として作られた数式を使います。
準周期データは、見た目が似ていますが、周期性を前提とした理論は使えません。
というよりも、準周期データで何かを調べたい時は、周期的ではない何かの違いを知りたいことが多いので、それを知るためのアプローチをします。
準周期データは、複雑な関係を持ちながら変化する動的なデータです。 そのため、 データベース から無計画にごそっと持ってきて 多変量解析 や データマイニング の手法を適用した程度では、知りたい情報が得られることはまれです。
筆者の経験の範囲ですが、準周期データの解析では、 データリテラシー や、 測定 の知識を駆使してデータを加工し、それから普通の 折れ線グラフ で、データを見ることが多いです。 ローテクですが、何が起きているのかがわからないデータを分析する時には、一番頼りになる方法です。
準周期データは、下記のように1次データ、2次データ、3次データの形にしながら分析していきますが、 どの形のデータでも、まずは、折れ線グラフでデータの様子を見ます。
準周期データを分析する時は、 データベースから持って来る段階で工夫したり、 持って来たものをさらに加工してから解析します。
万能ではないですが、RとPythonを使った例を作っています。
「Pythonによる機械学習入門」 システム計画研究所 編 オーム社 2016
機械学習
をPythonでするための本ですが、手形状の判別とセンサーデータの回帰分析の、2つの実施例が、詳しく書かれています。
時刻は、一対多で紐付けた方が良い事が書かれています。
「産業応用部門大会 講演論文集 2011年度 産業システムシンポジウム」 計測自動制御学会 2011
ソフトセンサー
関係の資料もあるのですが、
(株)山武の杉浦輝伸氏の「品質向上に向けたデータ活用」は、
品質管理にセンサーを活用する事の意義や、そのためのデータ解析を紹介しています。
「トレース管理」と呼んで、センサーデータを、ロットやバッチ毎でまとめておくことを提案しています。
これをしておくと、バッチ毎の重ね書きのグラフを解析できるようになります。
また、バッチ毎の代表値を計算できるようになります。
代表値がわかると、検査データと紐付けできるようになります。
KPIの発掘手法として、
相関分析
、
クラスター分析
、
主成分分析
、
重回帰分析
、PLSを紹介しています。
KPIになる代表値が見つかると、
SPC(統計的工程管理)
につなげられます。
このページの
1.5次データの解析
、
2次データの解析
、
3次データの解析
と、内容の一部が近いです。
「製造データ収集 :解析による製品品質向上のアプローチ」 黒澤敬、山縣謙一、村上栄治 著 電気学会研究会資料 電気学会 2011
データをバッチ単位で集計できるようにしておき、そのデータの見るべきポイントを、関数などを使って、切り出せるようにしておく。
そうして切り出した値を、KPIにして、SPC(統計的工程管理)
(
管理図
による監視)に使う方法を紹介。